我们考虑了一个单方面反馈的在线学习问题,其中学习者只能观察到真正的标签以进行积极的预测实例。在每回合中,$ k $实例到达并根据学习者部署的随机策略来收到分类结果,其目标是在部署单独的公平政策的同时最大化准确性。我们首先扩展了Bechavod等人的框架。 (2020)依靠人类公平审计师的存在来检测公平性违规行为,而是将动态选择的审计师的动态选择面板的反馈纳入了反馈。然后,我们通过单方面反馈的在线学习问题构建了有效的降低,并对上下文组合半伴侣问题报告公平性违反了公平性(Cesa-Bianchi&Lugosi,2009年,Gy \ \ \'{O} Rgy等。 ,2007年)。最后,我们展示了如何利用上下文组合半循环设置中两种算法的保证:exp2(Bubeck等,2012)和Oracle-seversefficited context-semi-bandit-ftpl(Syrgkanis等人(Syrgkanis等) 。以及任何单一人类审核员可能存在的人类偏见,但可以通过选择一个精选的面板来减轻。
translated by 谷歌翻译
我们研究了一个受个人公平的限制的在线学习问题,这要求类似的个体相似地治疗。与事先对个人公平的工作不同,我们不认为个人之间的相似性措施是已知的,我们也不认为这种措施采用某种参数形式。相反,我们利用了审计师的存在,审计师在没有阐述定量措施的情况下检测公平违规行为。在每一轮中,审计员审查了学习者的决定,并试图识别学习者不公平对待的一对个人。我们提供了一般的框架,将我们的模型中的在线分类降低到标准的在线分类,这使我们能够利用现有的在线学习算法来实现子线性遗憾和公平违规的数量。令人惊讶的是,在独立于分布绘制数据的随机环境中,我们还能够建立PAC样式和准确性概括保障(YONA和Rothblum [2018]),尽管只有获得了一种非常受限制的公平形式回馈。我们的公平泛化界定定性匹配Yona和Rothblum的统一收敛[2018],同时还提供了有意义的准确性概括担保。我们的结果通过Gillen等人解决了一个开放的问题。 [2018]通过表明在未知的单个公平性约束下的在线学习是可能的,即使在不假设基础相似度措施的强大参数形式的情况下也是可能的。
translated by 谷歌翻译
Vascular shunt insertion is a fundamental surgical procedure used to temporarily restore blood flow to tissues. It is often performed in the field after major trauma. We formulate a problem of automated vascular shunt insertion and propose a pipeline to perform Automated Vascular Shunt Insertion (AVSI) using a da Vinci Research Kit. The pipeline uses a learned visual model to estimate the locus of the vessel rim, plans a grasp on the rim, and moves to grasp at that point. The first robot gripper then pulls the rim to stretch open the vessel with a dilation motion. The second robot gripper then proceeds to insert a shunt into the vessel phantom (a model of the blood vessel) with a chamfer tilt followed by a screw motion. Results suggest that AVSI achieves a high success rate even with tight tolerances and varying vessel orientations up to 30{\deg}. Supplementary material, dataset, videos, and visualizations can be found at https://sites.google.com/berkeley.edu/autolab-avsi.
translated by 谷歌翻译
电缆在房屋,医院和工业仓库中很普遍,容易纠结。本文通过引入新颖的不确定性定量指标和与电缆相互作用以减少感知不确定性相互作用的新型不确定性定量指标和动作,扩展了对自动释放长电缆的先前工作。我们为Tangle操纵2.0(SGTM 2.0)提供了滑动和握力,该系统使用双边机器人自动解开大约3米长的电缆,并使用每个步骤的不确定性估算值估计,以告知动作。通过互动降低不确定性,缠结操作2.0(SGTM 2.0)的滑动和握住可以减少其必须采用的状态排列动作的数量,从而大大加快运行时间。实验表明,SGTM 2.0可以在1或2台上和图8节的电缆上取得83%的脱节成功,并且在这些配置中的70%终止检测成功,在无障碍精度上优于SGTM 1.0,超过43%,在全部推出速度上超过200% 。可以在sites.google.com/view/sgtm2上找到补充材料,可视化和视频。
translated by 谷歌翻译
折叠服装可靠,有效地是由于服装的复杂动力学和高尺寸配置空间,在机器人操作中是一项漫长的挑战。一种直观的方法是最初在折叠之前将服装操纵到典型的平滑配置。在这项工作中,我们开发了一种可靠且高效的双人系统,将用户定义的指令视为折叠线,将最初弄皱的服装操纵为(1)平滑和(2)折叠配置。我们的主要贡献是一种新型的神经网络体系结构,能够预测成对的握把姿势,以参数化各种双人动作原始序列。在从4300次人类注销和自我监督的动作中学习后,机器人能够平均从120年代以下的随机初始配置折叠服装,成功率为93%。现实世界实验表明,该系统能够概括到不同颜色,形状和刚度的服装。虽然先前的工作每小时达到3-6倍(FPH),但SpeedFolding却达到30-40 FPH。
translated by 谷歌翻译
本文展示了alphaRARDEN:一个自治的多种植花园,在1.5米×3.0米的物理测试平台中撒上和灌溉生物植物。alphanArden使用架空相机和传感器来跟踪植物分布和土壤水分。我们模拟个体植物生长和平面动态,以培训选择行动以最大化叶片覆盖和多样性的政策。对于自主修剪,alphanarden使用两个定制的修剪工具和训练有素的神经网络来检测紫杉角。我们为四个60天的花园周期提供了结果。结果表明,alphaRARARDEN可以自主地实现0.96个归一化多样性,在循环峰值期间保持0.86的平均冠层覆盖率。可以在https://github.com/berkeleyautomation/alpharden找到代码,数据集和补充材料。
translated by 谷歌翻译